% !Mode:: "TeX:UTF-8"
%!TEX program  = xelatex

%\documentclass{cumcmthesis}
\documentclass[withoutpreface,bwprint]{cumcmthesis} %去掉封面与编号页

\usepackage{subfigure}	%用于排版多张图片
\usepackage{float}	%用于排版图片位置
\bibliographystyle{plain}	%引用样式,参考文献

\usepackage{url}
\title{基于按年龄分布的Leslie模型对我国人口特征的预测}

\begin{document}

\maketitle
\begin{abstract} 
%摘要开始
%这里是我们的摘要

本文建立了我国的人口增长预测模型，对2023-2050年的总人口数量、人口结构变化做出了较长期的预测，并针对这一变化，提出了有关人口政策、人口控制和人口老龄化等问题的相关建议。
%2句型：首先，本文针对问题一的XX问题，对XX进行简化，利用XX知识建立了XX模型。其次，针对问题二的……。最后，针对问题三的……。

首先对于人口的预测，本文选择了尽可能关键的因素，经过分析与筛选，我们选择了受疫情影响较小的2010-2015年间的人口数据。本文将不同的年龄段按照5岁一个组别分成了若干组，分别计算抽样数据的出生率、死亡率、生育率、存活率等等，人口数据均采用2014年的官方数据，其中存活率选用2014和2019年，之后针对复杂庞大的人口问题做出了合理的理想化假设。同时，本文考虑到年龄结构的问题，对不同年龄段的人口进行预测，最后求出人口总和。
%3句型：针对XX模型的求解，本文使用XX算法，计算出XX，并用XX工具求解出XX问题，进一步求解出XX结果。针对XX模型……。针对XX模型……。

其次针对一系列的预测自变量，考虑到人口年龄结构对人口增长的影响，本文建立了按年龄分布的人口模型（Leslie模型），以上述数据建立了Leslie矩阵，然后建立相应的Leslie模型，该模型以女性为研究对象，计算出女性的预测人口后，再通过男女比例计算出总人口数量。经过理论分析，本文的模型误差在可接受的范围内，最终我们运用Leslie模型以及matlab得到了所要求的人口数据。


\keywords{ Leslie模型\quad 人口预测 \quad 女性人口\quad 人口老龄化   }

\end{abstract}
%摘要部分结束
%目录  （如果不需要则加注释即可）
\tableofcontents

%新的一页
\newpage
%从这里开始是第一个大的标题
\section{问题重述}%一

\subsection{问题重述及背景}

随着我国经济的不断发展，综合国力的不断增强，我国的现代化水平已经提高到了一个新的台阶。但是随之而来的是一系列问题，我国的人口数量也越来越多，根据2021年5月11日第七次全国人口普查的报告显示，我国的人口已经超过了14亿，但人口的出生数却在逐渐减少，为此，同年8月20日，全国人大常委会会议表决通过了关于修改人口与计划生育法的决定，修改后的人口计生法规定，国家提倡适龄婚育、优生优育，一对夫妻可以生育三个子女。在此基础上，我们要对2023-2050年中国人口总数，年龄结构变化做出相应的预测。

\subsection{数据来源}


附件A数据来源：国家数据https://data.stats.gov.cn/easyquery.htm?cn=C01

附件B数据来源：央广网
http://news.cnr.cn/special/2015lh/zbj/zkzyt/zk11/wz

/20150314/t20150314\_518001905.shtml

%从这里开始是第二个大标题
\newpage
\section{问题分析}


人口的变化受到众多方面因素的影响，因此对人口的预测与控制也就十分复杂，在众多的指标中，我们就要精确地筛选对人口影响较大的指标，题目中虽然强调了2021年我国的三胎政策，但本文认为，由于当今生存压力大，想要多出一个孩子对父母造成的压力是巨大的，这样的政策是政府为了调整人口增速的平衡，解决一些社会问题而做出的决策，它对于整体的人口变化率并不会有陡然的变化，所以本文并不将其作为一个决定性因素。

题目中要求对人口结构进行预测，所以我们应该收集到各个年龄段的人口数量，出生率，死亡率，存活率等等，从部分着手，最后简单求和得到总体信息，这样可以提高解决问题的效率。另外由于未来实际的人口标准数据未知，模型的检验方法就有一定的局限，我们将数据分为，训练集、测试集以及预测集。通过这样的方式结合“测试集”中人口的数量较大的人为因素的影响导致其发生的重大变化，如果在可接受的范围内，则可以确定模型的合理性，最终用作预测各年份的数量。

\begin{figure}[H]

\label{wentifenxi}     %创立一个标签，下文可以直接饮用其中的名字，如图\ref{}所示即可
\centering
\includegraphics[width=.8\textwidth]{问题分析框图.png}
\caption{问题分析流程}  %（引用图片）
\end{figure}


%第三部分开始了
\section{模型的假设}

本文提出以下合理假设：

\begin{itemize}
\item 中国社会稳定，不会发生重大的战争、忽略自然或者人为灾难对人口数量造成的巨大影响
\item 男女比例不会发生巨大的变化，我们可以根据一定数量的年份来确定一个稳定的值
\item 男女出生比例变化相对稳定
\item 不考虑人口迁移造成的相对影响
\item 忽略非育龄女性生育的情况
\item 根据以往生育政策的变化来看，我们认为政府的宏观政策是为了在更长的时间内保持人口的稳定而非大幅度改变人口数量，再结合现实因素，所以我们未将生育政策作为一个关键因素，但在分析问题时我们可以将其作为一个可能的原因。
\end{itemize}



\section{符号说明}
\begin{center}
\begin{tabular}{cc}
 \toprule[1.5pt]
 \makebox[0.3\textwidth][c]{符号}	&  \makebox[0.4\textwidth][c]{意义} \\
 \midrule[0.75pt]
%$美元符号代表公式
 ${{n}_{i}}(t)$	    	& 时间段$t$内第$i$年龄组的人口总数   \\ 
 $ s_i $	    & 理论存活率  \\ 
 $ b_i $	    	& 第 $i$年龄段的每个女性平均生育女儿的人数 \\ 
 $ B_i $	    	& 第 $i$ 个年龄段的每个女性平均生育婴儿的人数 \\  
 $ c $	    & 2014 年男女出生人口性别比 \\ 
 $ v $	    & 2014年女孩的出生率 \\ 
 $ D_i $	    	& 2014 年第 $i$年龄段的女性人口 \\ 
 $ d_i $	    	&  2009年第 i年龄段的女性人口 \\  
 $ p $	    & 2014 年女性总人口记 \\ 
 $ P $	    & 2009 年女性总人口记\\ 
 $ Y $	    & 2014 年抽样人数 \\ 
 $ y $	    & 2009 年抽样人数\\ 
 $ X_i $	    	& 2014 年在第$i$年龄段的抽样结果 \\ 
 $ x_i $	    	&  2009年第$ i$年龄段的抽样结果 \\  
 $ m_i $	    	& $s_i$与其倒数的平均值 \\ 
 $ S_i $	    	&  修正后的存活率 \\ 


\bottomrule[1.5pt]
\end{tabular}
\end{center}
\newpage
\section{模型的建立与求解}

\subsection{Leslie模型}
\subsubsection{模型准备}

将人口按年龄大小等间隔地划分成$m$个年龄组（譬如每10岁一组），模型要讨论在不同时间人口的年龄分布，对时间也加以离散化，其单位与年龄组的间隔相同。时间离散化为$t=0,1,2\cdots $ .设在时间段$t$第$i$年龄组的人口总数为${{n}_{i}}(t),i=1,2,\cdots m$，定义向量$n(t)={{[{{n}_{1}}(t),{{n}_{2}}(t),\cdots {{n}_{m}}(t)]}^{T}}$，模型要研究的是女性的人口分布$n(t)$随$t$的变化规律，从而进一步研究总人口数等指标的变化规律。

设第$i$年龄组的生育率为${{b}_{i}}$，即${{b}_{i}}$是单位时间第$i$年龄组的每个女性平均生育女儿的人数；第$i$年龄组的死亡率为${{d}_{i}}$，即${{d}_{i}}$是单位时间第$i$年龄组女性死亡人数与总人数之比，${{s}_{i}}=1-{{d}_{i}}$称为存活率。设${{b}_{i}}$、${{s}_{i}}$不随时间$t$变化，根据${{b}_{i}}$、${{s}_{i}}$和${{n}_{i}}(t)$的定义写出${{n}_{i}}(t)$与${{n}_{i}}(t+1)$应满足关系：
\begin{equation}\label{eq1}
\begin{cases}
{{n}_{i}}(t+1)=\sum\limits_{i=1}^{m}{{{b}_{i}}{{n}_{i}}}(t) \\
{{n}_{i+1}}(t+1)={{s}_{i}}{{n}_{i}}(t),\ i=1,2,\cdots ,m-1
\end{cases} 
\end{equation} 

在(\ref{eq1})式中我们假设${{b}_{i}}$中已经扣除婴儿死亡率，即扣除了在时段$\text{t}$以后出生而活不到$\text{t}+\text{1}$的那些婴儿。若记矩阵
\begin{equation}\label{eq2}
L
=
\left[
\begin{array}{ccccc}
  {b}_{1} & {b}_{2} & \cdots  & {b}_{m-1} & {b}_{m}  \\
   {s}_{1}& 0 & {} & {} & 0  \\
   0 & {{s}_{2}} & {} & {} & \vdots   \\
   {} & {} & \ddots  & {} & {}  \\
   0 & {} & 0 & {{s}_{m-1}} & 0  
\end{array} 
\right ]
\end{equation}                        
则(\ref{eq2})式可写作

$$n(t+1)=Ln(t)$$                           

当$L\ $、$n(0)$已知时，对任意的$t=1,2,\cdots $有
\begin{equation}\label{eq4}
n(t)={{L}^{t}}n(0)      
\end{equation}
 若（\ref{eq2}）中的元素满足
\begin{enumerate}

\item  ${{s}_{i}}>0\ ,\ i=1\ ,\ 2\ ,\cdots \ ,m-1$；
\item  ${{b}_{i}}\ge 0\ ,i=1\ ,2\ \cdots \ ,m$，且至少一个${{b}_{i}}>0$
\end{enumerate}

则矩阵$L$称为Leslie矩阵。只要我们求出Leslie矩阵$L$并根据人口分布的初始向量$n(0)$，我们就可以求出$\text{t}$时段的人口分布向量$n(t)$。
\textsuperscript{\cite{ref2,ref3}}



%\begin{itemize}
%\end{itemize}
\subsubsection{模型建立}

我们以2014年为初始年份对以后各年的女性总数及总人口数进行预测，根据附件A中所给数据，以五岁为间距对女性分组。则根据附件A,一共由$i=1,2,3,…,20$种年龄分组.(注:考虑到95岁人口数量和高龄老人的年龄分布问题,第i=20年龄分组我们定义为95岁以上,并且不会影响到生育率的计算)得出2014年处在各个年龄上的妇女人数的分布向量${{n}_{i}}(0),(i=0,1,2,...,20)$   \textsuperscript{\cite{ref1}}

根据附件A，可以直接得出，${{n}_{i}}(0)$为年龄范围为$5i-5$到$5i-1$的年龄组。

（2）计算处在第$i(i=0,1,2,...,20)$年龄段的每个女性平均生育女儿的人数${{b}_{i}},(i=0,1,2,...,20)$
根据附件A，我们可以知道在第$i$个年龄段$(i=0,1,2,...,10)$的每个女性平均生育婴儿的人数为${{B}_{i}},(i=4,5,6,...,10)$，而对于$i=0,1,2,3,11,12,…,20$的情况下，这些年龄组为非适龄生育年龄，不考虑特殊的极少数情况，我们将其设为0.附件B给出了2014年男女出生人口性别比c(女100计),据此可以算出当年女孩的出生率$$v=\frac{100}{c+100}$$由此可以算出2014年在第$i(i=4,5,6,...,10)$年龄组平均每个女性生育女儿的人数:$${{b}_{i}}={{B}_{i}}*v$$

(3) 计算第$i$年龄段的女性总存活率率${{ s}_{i}}(i=0,1,2,...,20)$：

计2014年第$i(i=1,2,3,...,20)$年龄段的女性人口为$D_i$,2009年第$i(i=1,2,3,...,20)$年龄段的女性人口为$d_i$.则2014年第$i(i=2,3,...,20)$年龄段女性总存活率$${{ s }_{i}}=\frac{{{D}_{i}}}{{{d}_{i-1}}}$$

我们通过抽样样本代替总体的方法来计算出$D_i$和$d_i$

设2014年女性总人口记为$P$, 2009年女性总人口记为$p$2014年抽样人数为$Y$, 2009年抽样人数为$y$.2014年在第$i$年龄段的抽样结果为$X_i$, 2009年在第i年龄段的抽样结果为$x_i$.

本文以2014年为例,根据样本法算出$D_i$的值.2009年同理.本文可以根据附件A得出P,Xi,Y的值.则第i年龄段占总年龄之和的比例为$$\frac{{{D}_{i}}}{P}=\frac{{{X}_{i}}}{Y}$$
求得
$${{D}_{i}}=\frac{P\cdot {{X}_{i}}}{Y}$$   
\subsubsection{模型求解}
经过上述模型建立，我们可以得到如图（\ref{nvxing}）示中$D_i$的结果：

\begin{figure}[H]

  %创立一个标签，下文可以直接饮用其中的名字，如图\ref{}所示即可
\centering
\includegraphics[width=.8\textwidth]{各年龄段女性抽样人口.png}
\caption{各年龄段女性抽样人口}  %（引用图片）
\label{nvxing}   
\end{figure}


同理我们可以算出$d_i$的值.并由此算出$s_i$的值$(i=2,3,...,20)$,
但是,我们发现在5-14岁,20-44岁年龄组中,存活率$s_i$的值大于1.在不考虑国家统计局数据错误的情况下,我们分析可能由以下几个原因导致:

\begin{itemize}
\item 样本总量不到实际人口的千分之一,无法完全代表整体的人口分布.
\item 统计的数据没有全面的在全国各个地方统计,没有代表性.
\item 在5-14岁,20-44岁年龄组中,国内外人员流动较大,在样本中,来我国留学工作的外国人远大于出国接受教育或出国务工的人数的数量.
\item 使用5年前和5年后同一批人的数量之比算存活率在统计学上可能无法准确代表一个年龄段的存活率.
\end{itemize}

尽管如此,本文依然认为,在误差允许的范围内,可以使用此方法来估算人口的数量.
本文使用了如下方法,对其进行修正:
取${{ s}_{i}}(i=2,3,4,...,9)$的倒数,记为$\frac{1}{{{s}_{i}}}$,算其与$s_i$的平均值为
$${{m}_{i}}=\frac{({{s}_{i}}+\frac{1}{{{s}_{i}}})}{2}$$ 
我们发现,$m_i$的值非常相近,但仍大于1,考虑到$s_10$与$s_11$差0.04\%,$s_11$与$s_12$差0.05\%,所以我们预计$m_9$与$s_10$差0.03\%. 
此时,得出
$${{m}_{i}}=\frac{1}{2}({{s}_{i}}+\frac{1}{{{s}_{i}}})$$
$$
{{S}_{i}}=\left\{
\begin{aligned}
 &2({{m}_{2}}-0.3)-({{m}_{3}}-0.3),i=1 \\ 
 &{{m}_{i}}-0.03,i=2,3,...,9 \\ 
 &{{s}_{i}},i=10,11,12,...,20 \\ 
\end{aligned} 
\right.
$$

其中$m_i$为$s_i$及其倒数的平均值.$S_i$为修正后的存活率(见附录A). $S_1$利用插值法算出为$2{S_2}-{S_3}$.
用EXCEL对计算出来的数据进行整理，然后运用MATLAB软件进行编程，计算出Leslie矩阵，
于是可以用上面(\ref{eq4})式进行预测。\textsuperscript{\cite{ref1,ref2,ref3}}

最终得到人口总数的变化如图（\ref{rkzs}）

\begin{figure}[H]
\centering
\includegraphics[width=.6\textwidth]{2023-2050总人口数量.png}
\caption{2023-2050总人口数量}  %（引用图片）
\label{rkzs}     %创立一个标签，下文可以直接饮用其中
\end{figure}

同时根据表格可以得到具有各个明显年龄区分特征的各个阶段总人数变化，如图（\ref{ggnld}）所示。
\begin{figure}[H]
\centering
\includegraphics[width=.6\textwidth]{各年龄段.png}
\caption{各个年龄段人口数量}  %（引用图片）
\label{ggnld}     %创立一个标签，下文可以直接饮用其中
\end{figure}


\section{模型的评价与推广}

\subsection{模型的优缺点}

\subsubsection{模型的优点}
\begin{enumerate}
\item 模型适用于人口结构复杂，受多因素影响的人口预测，可以按地区、按年龄分析我国人口变化情况，对把握影响我国人口变化重要因素有重大意义。
\item 模型的短期预测结果与实际数据吻合度高，而且各因素对我国人口的影响情况符合实际。

\end{enumerate}
\subsubsection{模型的缺点}
\begin{enumerate}
\item 仅考虑出生率、死亡率的影响，不计迁移等社会因素的影响，因而只适用于一个独立的人口系统。
\item 基准数据是某一年的人口统计数据，因此它的预测精度受基准数据的影响比较大。
\item 在预测我国人口增长情况中，我们对原始数据进行了一些处理，如女性分年龄组的人口数据向量，女性人口比率等，这些方法给最终的结果带来了一定的误差。
\end{enumerate}

\subsection{模型的改进与推广}
 
\subsubsection{模型的改进}
考虑政策因素，放开三胎后可以研究每个妇女生育胎次对中国人口增长的影响。计算人口分布的时候应该加上流动性因素，人口分布会更准确。
\subsection{数据的推广}
用该模型可用于分析城乡人口变动、男女性别比、人口老龄化对人口的影响。可定量分析一部分人口政策及社会因素对人口发展的影响，为社会其他领域，如教育，商业等的发展规划提供必要的人口信息。同时通过该模型得到详尽的逐年的人口年龄分布
\section{在实际意义上对预测结果的分析}

\subsection{不同年龄组的变化趋势}
由预测结果可知，在近期年内人口仍保持增长状态，过几年会保持到极高值，接下来一段时间人口会逐渐降低，这可能是由于人口政策和现在社会的育儿压力共同造成的，分析现有年龄比重如图（\ref{nianling}）所示，近年人口比重多成金字塔形，这也符合生物学角度来看的一个健康种群的年龄结构组成，与图中近年来人口增长的趋势比较来看，符合预测情况。

%图3
\begin{figure}[H]


\centering
\includegraphics[width=.6\textwidth]{各年龄段人数占比.png}
\caption{各年龄段人数占比}  %（引用图片）
\label{nianling}     %创立一个标签，下文可以直接饮用其中的名字，如图\ref{}所示即可
\end{figure}

另外，又得到的结果我们可以看出老年人的人口变化情况，如图（\ref{laonian}）所示。

\begin{figure}[H]
\centering
\includegraphics[width=.6\textwidth]{老年人数发展趋势.png}
\caption{2030-2050年老年人数发展趋势}  %（引用图片）
\label{laonian}     %创立一个标签，下文可以直接饮用其中的名字，如图\ref{}所示即可
\end{figure}

可以看出随着时间的增长，老年人口数量缓慢增多，这可能与我国不断进步和完善的医疗条件有关，从另一方面也表明了我国作为人口大国社会在不断进步的迹象。

\subsection{人口变化可能带来的利弊}
在总体趋势下，人口在宏观调控下，总体的数量趋势越来越少，这样的好处是资源、环境压力会变得相对较小，同时社会也相对更容易容易管理。 但也有一定的坏处，从国家整体来说的，比如劳动力紧缺、国际竞争力不高、战争能力不足等等。但相对于其他发达国家而言，我国人口仍有数量上的优势，这也是人口调控的一大优点。


\subsection{对人口调控的一些建议}
中国要顺利实现民族复兴的“中国梦”并长久屹立在世界民族之林，必须正确认识人口发展的内在规律，必须正确认识人口与经济社会发展的关系，必须高度重视人口变化及其对社会经济发展的重大而深远的影响，必须加以全球视野看待中国人口问题。我们建议，全面放开并鼓励生育以提升总和生育率至世代更替水平，加快构建积极应对人口老龄化体系以让每个人老有所依、老有所医。

针对目前不断下降的生育人数和生育率，我们要调整全面放开的生育政策，再结合实际社会状况的自然调控，最后实现最大化利用我国的人口资源，屹立于世界强国之林。
%附录

\begin{thebibliography}{99}  
\bibitem{ref1}刘秀芳,郭文喾,宋增禹等.三孩政策的实施对山西省人口增长的影响——基于Leslie模型[J].太原学院学报(自然科学版),2023,41(01):80-84.DOI:10.14152/j.cnki.2096-191X.2023.01.015.
\bibitem{ref2}姜启源等，数学模型（第五版），北京：高等教育出版社，2018
\bibitem{ref3}卓金武等，matlab在数学建模中的方法与实践，北京航空航天大学出版社，2018
\end{thebibliography}
\bibliography{book}

\newpage
%附录
\section{附录列表}

\subsection*{附件A}
包括各年份人口，生育率，死亡率，等初始数据
\subsection*{附件B}
原始数据参数
\subsection*{附件C}
最终结果数据，包括总人口，各年龄段人口
\subsection*{附件D}
matlab源码，Leslie模型计算

\end{document}
 
